运营商必须拥有大模型话语权。
鏖战大模型:运营商的“矛”与“盾”
人类社会正在跑步进入AI时代。从AlphaGo到ChatGPT,人工智能领域的里程碑事件不断刷新,这是一个新时代来临的标志。掌握海量数据与网络资源优势的电信运营商,在AI领域的布局备受关注。数字经济时代通过AI技术赋能,找到第二增长曲线的“新引擎”,将是运营商的新方向。
近日,三大电信运营商相继发布大模型产品。从中国联通的“鸿湖”图文大模型,到中国电信的大语言模型TeleChat、中国移动的九天·海算政务大模型和九天·客服大模型。运营商大模型背后的战略意图是什么?与市场上的大模型产品相比,运营商的大模型有何差异化?运营商进军大模型赛道,有哪些挑战?如何应对?
布局AI时代的战略选择
“三大运营商相继发布大模型是一种战略选择。” 野村综研咨询顾问张凯在接受《通信产业报》全媒体采访时表示,AI时代,运营商作为产业链的重要参与企业,不满足于仅仅提供算力基础,而是希望在未来数字化社会中,继续领导数字化产业链。因此,必须拥有大模型的话语权。
人类社会正在跑步进入AI时代。新一轮以AI为核心特征的科技革命进程加速,AI正在全方位地重塑企业竞争力、促进产业变革,成为数字经济时代的核心生产力。
AI时代,对基础设施提出了“更智能、更强算力、更低能耗”的要求,电信运营商作为新型基础设施建设的主力军,为人工智能发展提供高品质的云、网、算力。除了部署高品质的网络外,电信运营商以“5G+云计算+AI+应用”与合作伙伴生态协同,共同赋能数字经济。
发布大模型是运营商数智时代基础设施建设者和赋能者定位的注脚。今年6月底,上海世界移动通信大会期间,中国联通发布“鸿湖”图文大模型1.0。“鸿湖”图文大模型是首个面向运营商增值业务的大模型,具备以文生图、视频剪辑、以图生图等多种功能。7月6日,中国电信发布大语言模型TeleChat,发布会上重点展示了大模型+数据中台、大模型+智能客服、大模型+智慧政务三大行业应用的赋能产品。7月8日,在2023年世界人工智能大会“大模型与深度行业智能”创新论坛上,中国移动正式发布人工智能科技创新的最新成果:九天·海算政务大模型和九天·客服大模型。
中国电信研究院战略发展研究所所长饶少阳在接受《通信产业报》全媒体采访时表示,通过发展大模型,运营商对内可提升网络和数据安全、市场营销、客户服务等自身业务水平及服务能力,对外可提升运营商云、网服务和DICT的竞争力,重构产业数字化应用,打造全新智能应用等,为千行百业提供定制化行业应用模型。
在投入方面,张凯认为,运营商进入大模型赛道,更多的还是一种战略进入的姿态,并且在应用层级,而不是底层算法层级,获得一定的江湖地位和话语权。以此,自身的各项数字化业务能够获得AI加持,具备竞争优势,不至于在AI时代,自身数字化业务完全依赖其他厂商提供从底层算法到应用开发的所有AI能力。
鲜明的运营商特色
综观三大运营商发布的大模型,有鲜明的电信运营商特色。三家运营商的大模型都基于运营商在云网基础设施、数据治理、行业大数据、产业数字化等方面的综合优势。饶少阳表示,运营商大模型的特点主要体现在三个方面。第一,有丰富的、可按需配置的算力和网络资源用于大模型训练,相对来说成本更低。第二,有丰富的2C、2H、2B、2G的信息服务业务,与大模型有很好的契合度,能为大模型的落地提供丰富场景。例如,中国电信TeleChat大模型正是依托5G消息为政务客户提供政务短信智能化多轮问答服务。第三,三家运营商的政企客户数量均在千万级,有良好的客情关系,能够更快地推动行业大模型的规模落地。
三大运营商的大模型产品也有差异。在大模型模态方面,中国电信同时拥有大语言模型和多模态大模型,中国移动发布的是大语言模型,中国联通使用多模态大模型作为基座大模型。
组织与推进手段方面,中国电信和中国移动主要借助内部专业公司和研究院的研发力量,中国联通更多借助外力加快研发。
在具体行业大模型选择方面,三家运营商结合自身优势,略有差异。其中,中国电信部署了教育行业大模型,中国移动部署了海算政务大模型和客服大模型,中国联通目前主要是医疗大模型。
张凯表示,从发布信息看,联通的大模型更加偏向图文,中国移动和中国电信的大模型更偏向于产业和政务的支撑。在实际业务推广之中,哪一个方向能够获得更多市场并不明朗,但是图文方向的竞争对手更加具有优势,包括技术优势、先发优势、人才优势,都比通信运营商在这个领域更强,因此比较有挑战。
挑战与应对
在人工智能行业发展进程中,算法、算力、数据是拉动AI规模化发展的三大主要驱动因素。数据要素是AI训练与迭代的核心资源, AI能力的建设、核心是大数据的积累,更多的训练数据是AI模型快速做出的前提。数据量直接决定算法训练的效果,最终体现为算法能力。数据决定大模型的质量、性能和应用领域的广度与深度。
基于庞大的用户量,电信运营商成为数据要素的核心环节。运行商在时空数据方面有优势。大模型所需要的语言语素材料,通信运营商和互联网企业都具备一定的数据储备。但是,目前高质量中文数据集匮乏,行业数据集偏少,导致行业大模型训练难度高。对于大模型而言,数据的质量和多样性非常重要。张凯建议,运营商需要进一步丰富和多样化数据,以满足大模型的需求。这可能需要与其他行业或合作伙伴进行数据共享,或者开展数据采集和整合工作。
最底层的竞争力来自算法。算法需要庞大的高级人才和长期积累。电信运营商缺乏具有国际影响力的领军AI科学家,同时在既懂行业技术又懂大模型训练、微调工程的工程师队伍方面也有所不足。饶少阳表示,国内外龙头AI厂商在基座大模型参数规模和性能上领先于运营商,运营商目前过于依赖开源大模型,缺少自主算法,不利于大模型性能的进一步提升。张凯表达了同样的观点,他认为,整个运营商行业,相比百度这样长期投入AI的高科技企业,还是有些差距。当然,双方定位不同。在利用好开源算法框架的基础上,培养自身的大模型开发团队,也是有所可为的。比较具有挑战的是团队人才的引进、培养和如何激发研发热情,以通信运营商的薪酬和激励体系,可能很难和大厂以及接受巨额投资的创业公司竞争。
对于下一步运营商发展大模型,饶少阳建议应尽快建立一支一定规模的高水平人才队伍。扩大在算法、标注、训练等方面的专业工程师规模,引进深度学习等前沿领域有影响力的科学家,培养具备行业知识和AI技能的复合型人才,加强现有人才队伍的整合,发挥协同优势。
自主技术攻关研发方面,重点解决跨域异构算力的高效调度、千卡并行的高性能模型训练加速,以及云边协同的一体化训推等新型智算技术难题,将大模型能力用于提升自身运营能力与网络能力,打造差异化竞争。
生态合作方面,推进大模型生态合作,一是与行业企业合作开发和运营行业数据集,共建行业大模型产品;二是与华为、阿里巴巴、百度、商汤、科大讯飞等头部AI厂商合作,发挥运营商算力网络建设的优势,联手开展行业大模型的深度应用推广。
对于生态合作,张凯表示,如何建立有差异化,能够发挥自身优势的生态,是一个课题。作为大模型需求主体,运营商可以通过发展大模型增强自身现有服务水平。相比其他厂家,运营商在算力和网络方面拥有更深的积累和优势,不仅可以为自身的大模型提供有力支撑,还可以通过为其他参与者提供算力、网络等服务,直接从AIGC行业的繁荣中受益。例如,运营商可以制定按实际算力使用进行计费的策略,也可以在提供高效算力的基础上,根据性能与价格的关系适度加价,从而提升盈利能力。通过为其他AI从业者提供算力,扩大算力基础设施规模,降低算力成本,提高灵活性,用于自身的AI开发,也能大幅度降低自身的成本,获得双赢局面。